1 Introducción

2 Análisis de los métodos de enriquecimiento funcional

Términos totales Términos grandes %
ORA 249 39 15.66
GSEA 1206 111 9.20
elim 275 0 0.00
weight 202 1 0.50
PC 262 36 13.74
weight01 269 3 1.12

2.1 Resultados para ORA

2.1.1 Grafo

Grafo para los 20 términos más significativos de ORA. Abrir en nueva pestaña para ver en detalle.

2.1.2 Resultados

Enrichment plot de los 30 términos más significativos de ORA

2.1.3 Enrichment plot

2.2 Resultados para GSEA

2.2.1 Grafo

Grafo de los 20 términos más significativos para GSEA a mayor color mayor significancia. Los nodos rectangulares representan uno de los 20 términos. Abrir en nueva pestaña para ver en detalle.

2.2.2 Resultados

Enrichment plot de los 30 términos más significativos de GSEA

2.2.3 Enrichment Plot

2.3 Resultados para elim

2.3.1 Grafo

Grafo de los 10 términos más significativos para elim. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos.

2.3.2 Resultados

Enrichment plot de los 30 términos más significativos de elim

2.3.3 Enriquecimiento

2.4 Resultados para weight

2.4.1 Grafo

Grafo de los 10 términos más significativos para weight. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos. Abrir en nueva pestaña para ver en detalle.

2.4.2 Resultados

Enrichment plot de los 30 términos más significativos de weight

2.4.3 Enrichment Plot

2.5 Resultados para PC

2.5.1 Grafo

Grafo de los 20 términos más significativos para PC A mayor color mayor significancia. Los nodos rectangulares representan uno de los 20 términos. Abrir en nueva pestaña para ver en detalle.

2.5.2 Resultados

Enrichment plot de los 30 términos más significativos de PC

2.5.3 Enrichment Plot

2.6 Resultados para weight01

2.6.1 Grafo

Grafo de los 10 términos más significativos para weight01. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos. Abrir en nueva pestaña para ver en detalle.

2.6.2 Resultados

Enrichment plot de los 30 términos más significativos de weight01

2.6.3 Enrichment Plot

2.7 Comparativas generales

2.7.1 Calidad de los términos y WSC

Tamaño medio para los términos significativos detectados por cada uno de los métodos

Distribución del IC detectado por cada método

Dichos términos redundantes presentan poco enriquecimiento y por tanto no son biológicamente tan relevantes. Para lidiar con ellos podemos hacer un proceso de filtrado o filtrado doble, y siempre previamente a la clusterizarión, pues de forma inversa la clusterización se vería sesgada por dichos términos.

El paso fundamental reside en la aplicación del WSC, que basándose en el pull total de genes de interés seleccionará aquellos términos con mejor p-valor que en conjunto representen a todo el pull de genes de interés. Este algoritmo no suele tener mucha potencia si se usa de forma aislada, sin embargo, si lo empleamos como una herramienta adicional para el filtrado previo a la clusterización vamos a conseguir una mejor calidad de los clusters. Pese a ello en nuestros datos existen aún términos generales que abarcan una gran cantidad de genes, de forma que alteran el funcionamiento de WSC y pueden afectar negativamente al resultado, por ello antes de aplicar WSC es buena idea eliminar todos aquellos términos con un tamaño superior a 1000 g/t, obteniendo los siguientes resultados.

Estandar
WSC
WSC + Filtrado
Nº Términos Enriquecimiento Nº Términos Enriquecimiento Nº Términos Enriquecimiento
Fisher 249 2.04 232 1.98 193 2.14
GSEA 1206 0.72 954 0.81 848 0.79
elim 275 2.53 275 2.53 275 2.53
weight 202 2.51 202 2.51 201 2.51
PC 262 1.85 260 1.85 224 1.97
weight01 269 2.36 269 2.36 266 2.37

En la tabla superior vemos que si usamos WSC de forma aislada conseguimos descartar algunos términos para todos los métodos; principalmente GSEA que presenta una clara mejoría; sin embargo, su efecto no es muy destacable y en algunos casos incluso empeora el enriquecimiento medio. Al combinar WSC con un filtrado de los términos generales obtenemos unos mejores resultados en todos los casos, con un claro incremento de enriquecimiento en los métodos tradicionales y una sutil mejora en los métodos de control.

2.7.2 Medida PO

Utilizando el porcentaje de solapamiento (PO):

\[ (PO) = \bigg(\frac{\frac{k}{L_1}+\frac{k}{L_2}}{2}\bigg)*100 \]

Siendo k el número de términos compartidos por ambos métodos a comparar, L1 el número de términos del primer métodos y L2 los del segundo. Con ello podemos conocer cuantos términos comparten entre sí los distintos métodos.

Heatmap de las medidas PO para los 6 métodos de enriquecimiento funcional

2.7.3 Solapamiento de términos

Relación entre los términos de ORA, GSEA y PC

Relación entre los términos de elim, weight y weight01

Relación entre los 6 métodos de enriquecimiento

3 Clusterizado de los resultados

3.1 Resultados de ORA

3.1.1 Heatmaps

3.1.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.1.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.1.2 Tablas

3.1.2.1 Tabla estandar

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 4 6
5-20 términos 3 5
< 5 términos 13 11
Tamaño medio 12 11
Total 20 22

3.1.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 3 3
5-20 términos 7 8
< 5 términos 10 8
Tamaño medio 9 10
Total 20 19

3.1.3 Resultados

3.1.3.1 SE

Clusterizado mediante simplifyEnrichment para ORA

3.1.3.2 REVIGO

Clusterizado mediante REVIGO para ORA

3.1.3.3 SE - WSC

3.1.3.4 REVIGO - WSC

3.2 Resutados GSEA

3.2.1 Heatmaps

3.2.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.2.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.2.2 Tablas

3.2.2.1 Tabla estandar

Resultados del clusterizado para GSEA
simplifyEnrichment REVIGO
> 20 términos 9 21
5-20 términos 6 22
< 5 términos 17 27
Tamaño medio 37 17
Total 32 70

3.2.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 9 14
5-20 términos 4 20
< 5 términos 18 27
Tamaño medio 27 13
Total 31 61

3.2.3 Resultados

3.2.3.1 SE

Clusterizado mediante simplifyEnrichment para GSEA

3.2.3.2 REVIGO

Clusterizado mediante REVIGO para GSEA

3.2.3.3 SE - WSC

3.2.3.4 REVIGO - WSC

3.3 Resultados elim

3.3.1 Heatmaps

3.3.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.3.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.3.2 Tablas

3.3.2.1 Tabla estandar

Resultados del clusterizado para elim
simplifyEnrichment REVIGO
> 20 términos 4 2
5-20 términos 2 15
< 5 términos 9 12
Tamaño medio 18 9
Total 15 29

3.3.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 4 2
5-20 términos 2 15
< 5 términos 12 12
Tamaño medio 15 9
Total 18 29

3.3.3 Resultados

3.3.3.1 SE

Clusterizado mediante simplifyEnrichment para elim

3.3.3.2 REVIGO

Clusterizado mediante REVIGO para elim

3.3.3.3 SE - WSC

3.3.3.4 REVIGO - WSC

3.4 Resultados weight

3.4.1 Heatmaps

3.4.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.4.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.4.2 Tablas

3.4.2.1 Tabla estandar

Resultados del clusterizado para weight
simplifyEnrichment REVIGO
> 20 términos 3 2
5-20 términos 5 12
< 5 términos 11 18
Tamaño medio 10 6
Total 19 32

3.4.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 3 2
5-20 términos 5 12
< 5 términos 11 18
Tamaño medio 10 6
Total 19 32

3.4.3 Resultados

3.4.3.1 SE

Clusterizado mediante simplifyEnrichment para weight

3.4.3.2 REVIGO

Clusterizado mediante REVIGO para weight

3.4.3.3 SE - WSC

3.4.3.4 REVIGO - WSC

3.5 Resultados PC

3.5.1 Heatmaps

3.5.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.5.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.5.2 Tablas

3.5.2.1 Tabla estandar

Resultados del clusterizado para weight
simplifyEnrichment REVIGO
> 20 términos 5 2
5-20 términos 2 13
< 5 términos 19 31
Tamaño medio 10 5
Total 26 46

3.5.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 4 2
5-20 términos 4 12
< 5 términos 16 29
Tamaño medio 9 5
Total 24 43

3.5.3 Resultados

3.5.3.1 SE

Clusterizado mediante simplifyEnrichment para weight

3.5.3.2 REVIGO

Clusterizado mediante REVIGO para weight

3.5.3.3 SE - WSC

3.5.3.4 REVIGO - WSC

3.6 Resultados weight01

3.6.1 Heatmaps

3.6.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.6.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.6.2 Tablas

3.6.2.1 Tabla estandar

Resultados del clusterizado para weight01
simplifyEnrichment REVIGO
> 20 términos 5 1
5-20 términos 6 21
< 5 términos 19 12
Tamaño medio 8 7
Total 30 34

3.6.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 5 2
5-20 términos 6 18
< 5 términos 19 14
Tamaño medio 8 7
Total 30 34

3.6.3 Resultados

Clusterizado mediante simplifyEnrichment para weight01

3.6.3.1 SE

3.6.3.2 REVIGO

Clusterizado mediante REVIGO para weight01

3.6.3.3 SE - WSC

3.6.3.4 REVIGO - WSC

4 Conclusiones

4.1 Número de clusters

4.1.1 Clusterizado estandar

4.1.2 Clusterizado con WSC

4.2 Distribución de clusters

4.2.1 Clusterizado estandar

4.2.2 Clusterizado con WSC

4.3 Tabla comparativa

4.3.1 Tabla estandar

IC medio Media de clusters Media de tamaño Total términos
ORA 4.775219 21.0 11.5 249
GSEA 4.724345 51.0 27.0 1206
elim 6.227053 22.0 13.5 275
weight 6.607877 25.5 8.0 202
PC 4.366314 36.0 7.5 262
weight01 5.790941 32.0 7.5 269

4.3.2 Tabla WSC

IC medio Media de clusters Media de tamaño Total términos
ORA 5.450159 19.5 9.5 193
GSEA 4.730215 46.0 20.0 848
elim 6.317602 23.5 12.0 275
weight 6.660748 25.5 8.0 201
PC 4.682397 33.5 7.0 224
weight01 5.841431 32.0 7.5 266